2022年5月6日 アトラシアンのインシデント対応
まだ全部読んでいない
2022年4月5日 7:38 UTC
775社に影響
4月8日から4月18日までに復旧された
古いスタンドアロンアプリを削除する過程で二つの問題が発生した
なんのIDかが不明確だった
code:本来の流れ
削除依頼チーム
↓ 削除対象のアプリID
削除実行チーム
code:誤った流れ
削除依頼チーム
↓ アプリを削除するクラウドサイト全体のID
削除実行チーム
削除用APIがアプリID/サイトIDを受け入れるようになっていた
削除にあたって警告がなかった
削除が実行されてしまったサイトを復元しなければならない
当社のデータベースは、完全バックアップと増分バックアップを組み合わせてバックアップされています。これにより、特定の「時点」を選択して、バックアップ保持期間 (30 日) 以内にデータ ストアを復元できます。今回のインシデントでは、当社製品の主要なデータ ストアを特定し、大半のお客様に対して、サイトを削除する 5 分前の復元ポイントを安全な同期ポイントとして使用しました。非一次データ ストアは、同じポイントに復元されるか、記録されたイベントを再生することによって復元されました。一次データ ストアには固定復元ポイントを使用することで、すべてのデータ ストアにわたってデータの一貫性を保つことができました。
インシデント期間中は3時間ごとに打ち合わせをした
サイト削除より5分前を超えたデータ損失は確認されていない
再発防止
サイトの一括削除を直ちに停止した